Découverte de proportions analogiques dans les bases de données : une première approche
نویسندگان
چکیده
Résumé. Cet article présente un nouveau cadre pour la découverte de connaissances basé sur la notion de proportion analogique qui exprime l’égalité des rapports entre les attributs de deux paires d’éléments. Cette notion est développée dans le contexte des bases de données pour découvrir des parallèles dans les données. Dans un premier temps, nous donnons une définition formelle des proportions analogiques dans le cadre des bases de données relationnelles, puis nous étudions le problème de l’extraction des proportions analogiques. Nous montrons qu’il est possible de suivre une approche de clustering pour découvrir les classes d’équivalence de paires de n-uplets dans le même rapport de proportion analogique. Ce travail constitue une première étape vers l’extension des langages d’interrogation de base de données avec des requêtes « analogiques ».
منابع مشابه
C-SAKey : une approche de découverte de clés conditionnelles dans des données RDF
Résumé : L’exploitation des liens d’identité entre ressources RDF permet aux applications de combiner des données issues de différentes sources. Les approches permettant de lier des données sont largement fondées sur l’existence de clés éventuellement composites. Ces clés étant rarement disponibles, des approches récentes se sont intéressées à la découverte automatique de clés à partir de donné...
متن کاملGraphes de voisinage pour l'indexation et l'interrogation d'images par le contenu
Résumé. La découverte d’informations cachées dans les bases de données multimédias est une tâche difficile à cause de leur structure complexe et à la subjectivité liée à leur interprétation. Face à cette situation, l’utilisation d’un index est primordiale. Un index multimédia permet de regrouper les données selon des critères de similarité. Nous proposons dans cet article d’apporter une amélior...
متن کاملTechniques de fouille de données pour la réécriture de requêtes en présence de contraintes de valeurs
Résumé. Dans cet article, nous montrons comment les techniques de fouilles de données peuvent résoudre efficacement le problème de la réécriture de requêtes en termes de vues en présence de contraintes de valeurs. A partir d’une formalisation du problème de la réécriture dans le cadre de la logique de description ALN (Ov), nous montrons comment ce problème se rattache à un cadre de découverte d...
متن کاملModélisation d'objets mobiles dans un entrepôt de données
Résumé. La gestion d’objets mobiles a connu un regain d’intérêt ces dernières années, particulièrement dans le but de gérer et de prédire la localisation d’objets mobiles. Cependant, il y a peu de recherches sur l’exploitation d’historiques de bases d’objets mobiles. La première étape dans ce processus est la mise en œuvre d’un entrepôt d’objets mobiles. Seulement, les modèles d’entrepôts exist...
متن کاملForage distribué des données : une comparaison entre l'agrégation d'échantillons et l'agrégation de règles
Résumé. Pour nous attaquer au problème du forage de très grandes bases de données distribuées, nous proposons d’étudier deux approches. La première est de télécharger seulement un échantillon de chaque base de données puis d’y effectuer le forage. La deuxième approche est de miner à distance chaque base de données indépendamment, puis de télécharger les modèles résultants, sous forme de règles ...
متن کامل